Gefen: Optimizador Estocástico Optimizado
Descubre Gefen, el optimizador que reduce hasta 8x la memoria de AdamW, manteniendo el rendimiento. Ideal para entrenar modelos más grandes con mayor throughput.
Descubre Gefen, el optimizador que reduce hasta 8x la memoria de AdamW, manteniendo el rendimiento. Ideal para entrenar modelos más grandes con mayor throughput.